Краткий анализ работ по распознаванию образов

Проблема распознавания образов в настоящее время охватывает широкий круг задач, связанных с чтением букв, распознаванием речи, автоматическим управлением, с технической и медицинской диагностикой, с обучением автома­тов и разработкой адаптивных систем.

Применение алгоритмов распознавания образов в перечисленных выше об­ластях начинает давать ощутимые практические результаты. Известно, напри­мер, что диагнозы, поставленные с помощью вычислительной машины «Минск», содержали в Г5 раз меньше ошибок, чем при обычной клинической практике (при локализации опухолей головного мозга).

При решении сложных проблем эксплуатации авиационной техники по со­стоянию по существу могут быть использованы модели, применяемые в области распознавания образов и основанные на использовании аппарата многомерной математической статистики. При эксплуатации авиационной техники по состоя­нию объем назначаемых работ по обслуживанию является случайным. При назначении этого объема первоначально решается простейшая задача распоз­навания образов при наличии двух классов состояния — исправного и неисправ­ного. Эти классы состояний характеризуются многими случайными параметрами. Задача отбора признаков (контролируемых параметров), как мы увидим. ниже, также решается в рамках задач распознавания образов. Далее диагностика состояния при классификации техники как «неисправная» может быть сформу­лирована как типовая задача распознавания образов (с позиций распознавания образов могут быть, на наш взгляд, рассмотрены и некоторые задачи опреде­ления отказовых ситуаций оператором и другие эксплуатационные проблемы).

Весьма схематично типовую задачу распознавания образов можно сфор­мулировать так. Необходимо распознать ситуацию k, принимая решение d. Решение принимается на основании результатов экспериментов о. Зависимость v от k характеризуется распределением условной вероятности p(vjk). Правиль­ность принятого решения определяется величиной потерь L(k, d), соотносящей ситуацию k и решение d. Необходимо, чтобы принимаемые решения d(v) при поступлении результатов наблюдений v давали минимальное математическое ожидание потерь. Такая статистическая постановка задачи распознавания имеет много общего с известной задачей выделения сигналов иа фоне шумов.

Для практического внедрения результатов теории распознавания образов необходимо изучать свойства алгоритмов и принимаемых решений, предназна­ченных для реализации с помощью ЦВМ. При этом для решения задач рас­познавания образов применяются и методы исследования, получніїїіііщ |ы піні нс в несколько других областях. Так, например, уже сейчас находит примі ін мис алгоритм последовательного планирования эксперимента при нсследоимшмі ре­шающего правила для двухклассовой статистической задачи клип нфітлцнн. Одиако следует отметить, что несмотря на появление в последние гиды боль­шого числа специальных публикаций, проблема распознавания обрпти как научное направление до сих пор еще не может считаться ясно определенной, так как подавляющее большинство работ по распознаванию образин ноеюнцено анализу частных схем (хотя имеются работы по методологическим попрое їм рас­познавания образов). Во многих случаях задачи распознавания обрії шн трак­туются как задачи математической статистики и теории статистических реше­ний, применяются методы линейного, целочисленного и динамического иршрам — мироваиия. Для решения задач распознавания часто используют пт же метод стохастической аппроксимации и алгоритмы адаптации, байесовы оценки, метод потенциальных функций, дискриминантный и последовательный днплні. метод экстраполяции функций в условиях неопределенности, вариационный метод. Все эти методы в некотором смысле математически подобны, так как облада­ют одинаковым типом сходимости. Однако с практической точки зрения следует принять во внимание особенности получения необходимой априорной информа­ции и трудности реализации различных вычислительных методов. Процессы обу­чения с корректировкой и без корректировки, использующие параметрические и непараметрические процедуры оценок, могут в общем случае расе мл гран.) пая как проблема последовательной оценки неизвестных параметров. С. тсдусі от­метить, что использование при распознавании метода стохастической аппрокси­мации позволило получить новые результаты. В литературе, относящейся к ітой области, часто используется теорема стохастической аппроксимации, принад­лежащая Дворецкому.

Рассмотрим отдельные наиболее типовые подходы в области распознавания и в смежных с ней областях.

Отбор признаков. Важным этапом в процессе распознавания является от­бор признаков, по которым производится распознавание образа, и выявление связей между отобранными признаками.

Учет зависимости между отобранными для распознавания признаками позволяет извлечь большее количество полезной информации для проведения правильной классификации. В литературе отмечается, что малоинформативные, но сильно коррелированные признаки в общем случае могут составить высоко­информативную расиознанающую систему.

Информативность двух сильно коррелированных признаков может быть равна информативности одного из них. Волге того, оказалось, что широко распространенное мнение о том, что при наличии сильной стохастической, а тем более функциональной линейной зависимости между двумя признаками одним из них можно без ущерба пренебречь, справедливо лишь для отдельных частных случаев, в общем же случае правильным оказывается противоположный вывод. Поэтому возникает проблема: нельзя ли при исследовании многопара­метрических объектов отбросить часть параметров и заменить нх меньшим числом каких-либо функций от них, сохранив при этом вею полезную инфор­мацию. Эта проблема является основной проблемой факторного анализа как стохастического метода.

В литературе предлагается способ отбора признаков, при котором и ка­честве критерия оптимальности принят так называемый обобщенный критерий Фишера, и показывается, что признаки, выбранные предложенным смпепГилі, являются более информативными.

Интересна проблема отбора признаков и одновременного принятии рі шення о распознавании образов. Пусть имеется несколько классов обьсктпи, харікіе — рнзующихся /г-мерными векторами признаков.

Для решения задачи распознавания можно рассмотреть іісгіниі. ічі ни нінз — мененный специальный случай последовательной процедуры Ншімл іи» тсдо — вательный критерий отношения вероятностей. Оказываете», чіп іі|шіі|ніН ( ия классификации), основанный на последовательных решениях ни пи о и (m. ice «ВЫГОДНЫМ», чем критерий, получаемый при фиксирошіїїішм Mill II ІІнГі Ни Іі’ІІНЙ (признаков). Поясним это утверждение. Если имеется itiu піннії ( Яц

^объект принадлежит к первому классу) и единственная конкурирующая гипо­теза Н2 (объект принадлежит ко второму классу), то на k-м шаге отношение вероятностей равно Р (Хк! Ні)

Aft = р Iff ^ ~ * ГДе — ^-мерный вектор, компоненты которого являются

характеристиками рассматриваемого объекта (предполагается, что параметры условных распределений Р(Х/Ні) были оценены по результатам нескольких «пробных» наблюдений).

Область принятия гипотез Hi и Н2 имеет вид:

{Х-Л>В}, Х-Л<Л, Л<В.

В обоих случаях происходит «остановка» выбора признаков, объект отно­сится к соответствующему классу и вероятности Р(Х/Ні), і= I, 2 переоценива­ются. Затем классифицирующее устройство переходит к следующему объекту. Если Льє(Л, В), то классификация не производится и процедура отбора приз­наков продолжается. При достаточно большом числе испытаний (по сравнению ■со средним числом испытаний до момента «остановки») классификация для каждого объекта с высокой вероятностью будет проведена до конца. При этом можно улучшить описанную процедуру, если исходя из нескольких пробных испытаний проранжировать характеристики классифицируемых объектов таким образом, чтобы наиболее существенные из них были расположены вначале (использовались первыми при распознавании объектов).

Сейчас уже в достаточной степени изучен вопрос об учете стоимости вы­бираемых для распознавания образов признаков. Оказывается, что в этом случае задача оптимального распознавания с успехом решается методом дина­мического программирования. На основе этого метода может быть построена и оптимальная система распознавания—оптимальный классификатор, способный выбирать наилучшую последовательность признаков.

Существует и метод выбора и упорядочивания признаков в системе для распознавания образов, не требующий вычисления вероятности неправильного распознавания или полных знаний о распределении вероятностей рассматривае­мых образов. Основная идея этого метода заключается в предварительном «взвешивании» признаков в соответствии с их относительной важностью при описании образов. Причем «взвешивание» не зависит от решающего правила, используемого при распознавании. При этом вводится определение важности признака и критерий для ее определения, затем уже можно описать процедуру выбора и упорядочения признаков.

Важную роль в процессе распознавания образов играет и предварительная обработка информации о признаках перед принятием решения о распознава­нии с целью улучшения точности распознавания и снижения требований к памяти вычислителя. Здесь возникают вопросы минимизации числа признаков и отбора признаков в случае их пересечения. О трудности решения этих и близ­ких к ним вопросов свидетельствует такой факт: наличие в образе перекрыва­ющихся ячеек делает либо малоэффективными, либо просто неприменимыми некоторые традиционные методы распознавания образов.

Для выбора признаков в настоящее время предлагается использовать фи­зический, топологический, математический (по энтропии) и статистический методы. Существует даже процедура, обосновывающая отыскание и вычеркива­ние избыточных признаков с общих позиций бионики, при этом рассматрива­ется возможность сравнений различных алгоритмов распознавания, если исполь­зуются одни и те же признаки.

Типовые алгоритмы распознавания образов. Рассмотрим алгоритм, примы­кающий к алгоритмам М. М. Бонгарда и В. Л. Браиловского [66]. Этот алгоритм является развитием известного метода «КР-наборов», предложенного В. Броу­нингом и Г. Бледшо [82]. Пусть каждый образ представляется также л-мерным двоичным вектором X и может принадлежать одному из N классов. Обучение основывается на выборках объема S из каждого класса: хц, i=l,…,N; /= = 1,…, 5. Алгоритм обучения заключается в следующем: случайно выбираются р из п координат и для данного X из вышеупомянутой выборки строится век­тор fi(x) = {/i, o(x), /i, iW / _ где fu=l, если на местах с выбраи-

1,2 1>

ными координатами стоит двоичное число /, —1. Для nuCpuiiiioio Хц

такая процедура производится k раз, в результате чего полупится інмор f{x) = {fi(x),…, fa(x)}.

Для каждого хц эти k подмножеств координат одни и те же, Ни осінша-

I ^ ^ I

нии полученной таким образом матрицы <2 / (xij) > • • •. / ( ‘"/v / м "оный

1/-1 У-1 I

вектор X относится к классу, для которого скалярное произведение / (лij)X

X/ (.*:) максимально, i= I………. N. Математическое ожидание МІ У, / {хц) ражается через величины т(хцх)—число общих координат у иск горой х0х. В литературе исследована вероятность правильного распознавании лот алго­ритма для больших выборок (при S->■ оо) и разбирается его сини. г ncгодом стохастической аппроксимации.

Многие задачи распознавания образов успешно решаются в предположе­нии гауссоности распределения признаков. Типична здесь следующая ситуация. Пусть имеется N классов: х±,…, xN. С классом х, связано распределение

P(X/0j) с неизвестным параметром 0f. Для каждого класса известны……………….. рное

распределение параметра 0; и выборка объема пи подчиненная распределению Р(Х/ві). Имеется наблюдение X, которое подчинено одному из распределений Р{Х/в;), (=1,… N, неизвестному для наблюдателя. Требуется определить с возможно меньшими вероятностями ошибок, к какому классу относится. V. Ре­шение получено в случае, когда Р(Х/ві)—многомерные гауссовские распреде­ления, параметры которых неизвестны. Предлагается на основании имеющих­ся предварительных выборок объемов П; построить выборочные средине Ці и ковариационные матрицы Ф,- и сравнивать величины

(Х-цО’ФгСХ— ц;), і — I…………. N.

Следует отметить, что допущение многомерной нормальности распределения является общим для большинства статистических методов. Однако обоснован­ность такого допущения исследуется редко. Известны примеры распределения случайных величин безусловно покомпонентно нормальных, но не являющихся многомерно нормальными. В практически интересных случаях число необходи­мых данных для проверки по этому критерию растет чрезвычайно быстро с ро­стом числа измерений, что не позволяет провести полную проверку. Поэтому предлагается методика построения частичных процедур проверки многомерной нормальности. Существуют численные примеры, показывающие, как частичная проверка позволяет обнаружить распределение, безусловно нормальное по всем переменным, но не являющееся многомерно нормальным.

Предположение о том, что в задачах распознавания образов многомерные распределения вероятностей для разных классов являются гауссовскими и име­ют равные матрицы ковариаций, может привести к потере информации, заключающейся в наличии корреляционных связей между признаками. Поэтому в литературе начинают появляться работы, в которых рассматриваются при­ближения распределений, отличные от нормальных: оптимальное приближе­ние л-мериого дискретного распределения вероятностей р(хI. . . Хп) с помощью распределения с «деревом» зависимостей первого порядка. В качестве меры близости при этом используется мера информации и утверждается, чіп при­менение процедуры к опытным данным приводит к максимально прандоиочобной оценке распределения.

Известна интересная задача классификации образов по принципу. чгед — ства». Согласно этому принципу, неклассифицированной точке и іі[»и ір. шгтве

образов ставится в соответствие ближайшая из множеств кліцтш|»іііприіі………….. их

точек. Особенность этого метода распознавания заключается н тим, чиї ка. к юй новой точке в пространстве образов ставится в соответствие лишь пни ычка

из точек, относящихся к классифицированным образам. Перонний: и……….. п‘>кн в

данном случае меньше, чем суммарная ошибка, получиемни при nr in и. нныппи метода Байеса.

Рассмотрим типовую постановку задачи распознавания образов с позиций дискриминантного анализа. Как нам уже известно, в задачах классификации обычно необходимо однозначно сопоставить объект, характеризуемый наблю­даемым числом или вектором у, и один из k классов при известных соответ­ствующих плотностях распределений Pi {уф), i== I,…, /г, р —чаще всего обозна­чает вектор параметров, который, как правило, неизвестен. Поэтому часто вме­сто значения В подставляется оценка этого вектора, полученная по результа­там так называемой облучающей или управляющей выборки для каждого і ИЗ популяций с ПЛОТНОСТЬЮ Pi (уф).

Таким образом, задача классификации решается обычно после решения задачи оценивания вектора р. Можно решать одновременно задачу классифи­кации и задачу оценивания. Для этого введем вектор 0= (0і, …, 0„) «пара­метров решения»: 0,-=1, если наблюдаемый объект отнесен к i-му классу, и 0і = О—в противном случае. В силу единственности решения и обязательного его принятия всегда 2 ®/ = I ■ Совместная задача классификации и оценивания

і

сводится поэтому к задаче оценивания параметров 0, р. Далее можно рассмот­реть решение следующих вариантов описанной выше задачи в предположениях, типичных для дисперсионного анализа — оценка максимального правдоподобия при классификации одного объекта (в предположении одномерности и нормаль­ности плотностей Рі(уф) с неизвестными дисперсиями и средними выводятся оценки максимального правдоподобия для параметров этих распределений и для вектора 0 параметров решений); .оценка максимального правдоподобия при одновременной классификации т(т>) объектов (здесь предположение о распределении объектов аналогично предположению первой задачи); решение задачи одношаговой классификации, задачи классификации по подгруппам при известной классификации ‘по группам и задачи двухшаговой классификации (здесь использованы обычные линейные модели дисперсионного анализа).

В большинстве работ по распознаванию в качестве основного критерия ис­пользуется вероятность неправильной классификации либо некоторая функция риска от неправильной классификации, однако существует и другой критерий для проведения классификации — критерий полезности, имеющий некоторые преимущества по сравнению с известными критериями.

В последние годы большое внимание уделяется задаче распознавания об­разов, признаки которых являются случайными функциями времени.

Пусть каждому образу соответствует некоторый входной сигнал распозна­вания — случайная функция с определенным распределением вероятностей (для каждого заданного класса образов). Если заданы эти распределения вероятно­стей, а также априорные вероятности появления образов различных классов, то методами теории статистических решений можно найти оптимальный — алго­ритм, однозначно устанавливающий для каждого данного входного сигнала распознавания соответствующий ему класс образов. Уже найдены такие алго­ритмы (обучения и самообучения), которые являются оптимальными байесовы­ми алгоритмами.

Они обеспечивают максимальное использование информации, содержащейся в обучающих реализациях сигналов.

Многие исследователи идут по пути разработки общих подходов к машин­ному распознаванию образов и эвристических методов, дополняющих матема­тические подходы. При этом создаются подробные алгоритмы всех стадий об­работки данных, анализа входных и выходных данных и описываются части общей программы: обучение—формирование понятий в памяти ЦВМ; сокраще­ние описания понятий — изменение структуры записи для сокращения занятого объема памяти и опрос — обработка, выясняющая соотношение двух понятий (равенство их или включение одного понятия в другое). Один из общих под­ходов к созданию машинных алгоритмов заключается в том, что на основании идеи «расширения состояний» предлагается метод уменьшения размерности при решении задач распознавания образов, обнаружения неисправностей в сложных системах, задачи о назначениях и некоторых задач управления.

Важным шагом при решении задач распознавания образов на ЦВМ явля­ется принципиальная оценка возможности получения решения. Имеется пример получения отрицательного результата — в случае, когда рассматривается мно-

Краткий анализ работ по распознаванию образов

жество А положительных целых чисел, записанных и двоичном коде. Оказы­вается, что некоторые из видов множеств А являются нерегулярными в том смысле, что их невозможно распознать с помощью вычислительной машины с конечным числом состояний.

Рассмотрим кратко некоторые алгоритмы с адаптацией. (Іростеппіпс задачи распознавания с адаптацией сводятся к разработке процедуры непрерывной оценки коэффициентов разделяющей поверхности при классификации на два класса. Предполагается, что множества признаков классов являются выпуклы­ми непересекающимися подмножествами пространства R". Доказываются тео­ремы о существовании разделяющей поверхности. Теоремы иллюстрируются геометрическими построениями. Рассматриваются некоторые простые решающие адаптивные процедуры, включающие в себя правила разбиении « мерного про­странства на две области с помощью гиперсферы.

Существует и адаптивная система распознавания образов более сложного вида (исследовалась система, содержащая достаточно общее правило построе­ния линейных или кусочно-линейных дискриминантных функции дли разделе­ния образов на несколько классов). Адаптивная процедура и этом случае представляет собой процесс обработки групп образов. Обучающая последова­тельность состоит из групп векторов в матричной форме вместо обычно исполь­зуемой последовательности векторов. Доказывается, что адаптивная процедура сходится за конечное число шагов, если решение существует, п рассматрива­ются необходимые и достаточные условия линейной разделимости каждого подиабора из d+l образов. Предложенная процедура может быть реализована путем незначительного усложнения существующих систем распознавания обра­зов (систем без адаптации). В публикациях приводятся интересные результаты моделирования таких алгоритмов на ЦВМ.

Еще один типовой подход к распознаванию образов с адаптацией сводится к следующему, изучается система классификации объектов, в которой принима­ются два решения относительно наблюдаемых объектов: первое — «скорое», на основании неточных значений условных вероятностей получаемых наблюде­ний при различных гипотезах о наблюдаемых объектах; второе — вполне точ­ное, основанное «а некоторой дополнительной информации. Результаты точного решения используются для корректировки упомянутых условных вероятностей. При этом рассматривается скорость сходимости такой процедуры к оптималь­ному байесову решению. Оказывается, что эта скорость сходимости определя­ется средней длительностью получения второго решения, которая зависит от статистической неопределенности «скорого» решения.

Учет деятельности человека в системах распознавания образов. Перейдем к рассмотрению эвристических подходов в задачах распознавания образов. Пусть некоторый статистический источник создаст бинарную последователь­ность £( из символов А и В. Требуется определить статистическую структуру этой последовательности. Если предположить, что последовательность Et есть сложная цепь Маркова некоторого порядка, то можно оценить последователь­но условные вероятности p(A/Sn), где Sn—последовательность событий длины п. Процесс прекращается, если по критерию %-квадрат p(A/Sn)=p(A/Srt, А) = =p(A/Sn, В), или п=по.

Существует и более общая процедура, основанная на оценке всех услов­ных вероятностей одновременно с n^«i — Для получения последовательности Et использовались способности человека к — предсказанию: индивидууму пооче­

редно показывали карты с символами А и В, соответствующими последова­тельности £(. Перед показом следующей карты индивидуум предсказывал ее, причем эти его предсказания запоминались. Последовательность £, являлась двоичной функцией от последовательности состояний источника с числом состо­яний большим двух и представляла собой цепь Маркова. Исследовалось, какие состояния источника индивидуум «отличает» и в каком порядке, влияние пред­сказаний ранних на более поздние, отличие стратегии предсказания индвидуума от вышеупомянутой процедуры оценки. Уже имеются интересные численные ре­зультаты экспериментов и указано, что способность человека к предсказанию оказалась неожиданно высокой. Затронутым выше вопросам исследования человека как датчика информации (с учетом опыта человека и его тренирован­ности) посвящен фундаментальный труд [84].

В настоящее время возрастает стремление к исследованию искусственного интеллекта. Область иссследоваиия искусственного интеллекта пока четко не опре­делена. Большинство форм поведения человека может быть представлено в виде программы автоматов, но искусственный интеллект должен включать и то, что не укладывается в обычную программу. По мнению ряда авторов, сей­час имеются два основных направления исследований искусственного интеллек­та: разработка программ возможных преобразований для получения опреде­ленных результатов, не вникая в суть механизмов мозга, и моделирование доступных механизмов мышления. Пока неизвестно, всегда ли поведение человека полностью детерминировано. В то же время показано, что возмож­ности вероятностных автоматов ие превосходят возможности детерминирован­ных, поэтому считается, что концепция детерминизма целесообразнее при изу­чении искусственного интеллекта. При анализе поведения человека используется тактика поиска экстремума — это применимо к играм, доказательству теорем, распознаванию образов. При этом важную роль играет обучение. В основном пока преобладает подход, связанный с исследованием восприятия человеком и принятия им решений.

При распознавании образов главную роль играют признаки изображений. Нейрофизиологические исследования раскрывают некоторые механизмы выделе­ния признаков в нервной системе (например, в глазу лягушки и зрительной коре кошки открыты детекторы простых частей изображений).

Задачи распознавания образов, решаемые человеком, имеют три разновид­ности: решение задачи при заданном законе классификации; при наличии обуча­ющей последовательности, в которой известна принадлежность изображений классам; создание человеческим мозгом классификации заданных изображений на определенное число классов. Формальное воспроизведение алгоритмов, по которым осуществляется решение последних двух задач в мозгу человека, явля­ется сложным. Все существующие алгоритмы распознавания, как не раз отме­чалось выше, работают в два этапа: при обучении выделяются признаки изо­бражения, по которым затем принимается решение на проведение классифика­ции. Задача полностью разрешима, когда можно найти пространство измере­ний, в котором выполняется требование компактности (например, линейное преобразование пространства измерений, как было показано Г. Себестианом (51], является ортогональным преобразованием, позволяющим достичь компактности изображений).

Р. Веллманом 174] в популярной форме изложены имеющиеся на сегодняш­ний день сведения о структуре и деятельности мозга. Рассмотрены модели та­ких явлений, как память, способность мозга распознавать образы, процессы решений и способность к обучению. Особое внимание уделено рассмотрению моделей процессов принятия решений, показана многоступенчатость этих про­цессов. Р. Веллманом делается попытка оценить возможности человеческого разума в будущем. Опубликованные работы по исследованию искусственного интеллекта — лишь начало решения огромной научной проблемы. Однако уже сейчас можно сказать, что приложения результатов исследований искусствен­ного интеллекта весьма многообразны: автоматическое распознавание образов различной природы, автоматический перевод, разговор с машиной, модели сен­сорных систем и восприятия, принятие решений машиной, модели управления, управления с эвристическим поощрением и др. Все чаще появляются работы, в которых рассматриваются задачи классификации с помощью экспертов и ста­вится вопрос: что выгоднее — иметь мало высококвалифицированных экспертов или много экспертов низкой квалификации.

Отметим также, что модели, учитывающие эффект участия человека при решении различных технических задач, безусловно, далеко не совершенны. Од­нако несмотря на то, что точность используемых здесь методов может подвер­гаться сомнению, количественный подход при решении упомянутых задач более эффективен, чем отказ от такого подхода.

Технические средства распознавания образов. В настоящее время считается решенным вопрос об отделимости двух классов сетью из пороговых элементов (имеется эффективный алгоритм и некоторые условия отделимости). Создаются распознающие системы, использующие модель нервной клетки как аналоговое пороговое устройство. Электронной моделью нервной клетки служит блокирую-

щий осциллятор, управляемый напряжением. Появляются итеративные системы обучения распознаванию, в литературе приводятся формулы логических пере­ключательных функций, используемых при распознавании, и даются блок-схемы аппаратуры реализации алгоритмов распознавания.

Для анализа задач распознавания образов большой размерности требуется устройство обработки сигналов, обладающее следующими особенностями: воз­можностью быстрой обработки большого количества информации, многообра — зованием операционных функций и гибкостью системной структуры.

Введение учета времени в устройства распознавания в качестве равноправ­ной координаты аргументируется упрощением процесса распознавания, так как при этом сглаживается характер различий между проблемами распознавания и искусственного интеллекта.

В настоящее время обоснована схема нейронной сети, способной обучаться распознаванию образов. Основные характеристики нейронов, из которых постро­ена сеть, соответствуют известным физиологическим данным. При этом учтены также и некоторые результаты самых последних исследований. Предлагаемая сеть способна хорошо различать образы даже при сильных искажениях.

Уже созданы такие устройства, как генератор искусственных образов для распознавания, которые предлагается использовать вместо естественно получа­емых выборок натуральных образов. При условии, что угадана природа иска­жений, порождающих нужный класс, такой метод оказывается ‘существенно бо­лее удобным и дешевым.

Предлагаемый генератор в качестве эталонного образа может использовать любое изображение, например, осциллограмму, письменный знак или фотогра­фию. Набор допустимых преобразований включает в себя при этом как дефор­мации плоскости изображений типа растяжений по осям хну, поворота и сдви­га, так и разного рода контролируемое «зашумлеиие».

Монографии и сборники по распознаванию образов. В сборнике [2] рас­сматриваются вопросы разработки специализированного математического обес­печения для распознавания речевых сигналов на ЭВМ и создания специальной аппаратуры. Обсуждаются также вопросы автоматического распознавания речи. Обзор работ в этой области содержится в [2].

В приложении к монографии Г. П, Шибанова [66] имеется содержательный обзор по вопросам іметодологии ‘распознавания ‘Образов, насчитывающий 176 наименований. Сама монография Г. П. Шибанова представляет большой инте­рес для специалистов, использующих в своей деятельности приемы и методы распознавания образов, в ней содержатся также конкретные технические ре­шения и практические реализации распознающих устройств весьма универсаль­ного характера.

В книге Б. Батхелера [71] уделено основное внимание эвристическим и экспериментальным приемам распознавания образов. Наиболее важным в ин­женерных проблемах автор считает нахождение эффективных алгоритмов, учи­тывающих стоимость и скорость выполнения процедуры распознавания. В кни­ге описаны методы классификации образов, даны сравнения классификаторов, рассмотрена их конструкция, применение и даны прогнозы иа будущее. Ряд интересных работ по использованию методов прикладной статистики при реше­нии задач распознавания образов содержится в работе [69].

В сборнике [44] излагаются нелинейные и линейные методы распознавания образов, предназначенные для решения широкого класса практических задач.

История развития работ по распознаванию образов излагается в [19], об­суждается идеология развития перспективных методов в создании распознаю­щих систем, рассматриваются методы анализа сигналов и выделения признаков, описываются разработанные в лаборатории (США) РАДС ‘некоторые системы распознавания образов, обсуждаются результаты проведенных экспериментов.

В [55] видным японским специалистом по распознаванию образов Танакой Кокити дай анализ существующих считывающих и распознающих устройств, их быстродействия и надежности. Монография [71] также посвящена проблемам распознавания образов. В ней отмечается, что при выборе того или иного алго­ритма классификации авторы останавливаются на его практической полезности, хотя порой не дают достаточного математического обоснования. В связи с этим широко применяется эвристическое программирование.

Приводятся практические рекомендации и обсуждаю гея особенное і и реп лизании различных классификаторов, описываются приложения в технике, меди­цине и других областях и обсуждаются перспективные направленна в класси­фикации образов.

В [92] рассматриваются решающие функции, методы классификации образов, детерминистский и статистический подходы при обучении классификаторов. Уделено также внимание предварительной обработке входных данных и мето­дам отбора признаков.

Состояние проблемы распознавания образов с позиций ее значимости в различных областях человеческой деятельности дано в (50]. В книге отмечается, ■что в эпоху иаучио-техиической революции существенно возрастают требования к технике обработки информации. С этим связано и развитие теории распозна­вания образов и широкое распространение распознающих устройств в послед­ние годы. Здесь отмечается также, что начало фундаментальных исследований в области распознавания относится к 1966 г. Отмечается, что совершенствование — аппаратуры для распознавания различного рода информации во многом будет зависеть от успехов микроэлектроники, совершенствования операционных систем ЭВМ. Указываются следующие направления работ: специализированные систе­мы обработки информации для использования в промышленности, на транспорте и других областях, обладающие возможностями распознавания одного вида ■специальной информации; системы для распознавания букв и цифр, схем и чертежей, материалов и веществ по химическим и физико-механическим свойст­вам, звуковых сигналов, естественной речи, математических знаков и. выраже­ний; обучающиеся и обучаемые системы; специализированные операторы, язы­ки и операционные системы дли распознавания, специальные технические сред­ства (читающие устройства, память, многопроцессорные микро-ЭВМ и т. д.). Важность работ по проблеме распознавания подчеркивается тем обстоятель­ством, что в США, например, они проводятся при участии управления косми­ческих исследований (NASA), национального института здравоохранения и уп­равления перспективных исследовательских работ.

Создание высокопроизводительных систем роботов, совершенствование си­стемы научно-технической информации, машинный перевод и многие другие важные проблемы связываются с теорией распознавания образов.

В заключение отметим, что наиболее полным из известных нам обзоров по распознаванию образов является обзор, составленный Кэнелом (85]. В нем все материалы разбиты иа следующие группы: журнальные статьи, книги и об­зоры по распознаванию образов, модели автоматического распознавания, ме­тодология создания систем распознавания образов, оценка и отбор статисти­ческих признаков; размеры обучающих выборок и оценка ошибок, статисти­ческие методы распознавания; структурные методы, применение распознавания на практике; будущее распознавания.

Обращает на себя внимание и монография (82], выпущенная известным спе­циалистом по распознаванию образов К. С. Фу, в которой строгий теоретичес­кий подход сочетается с широкими практическими приложениями.

Глава II